PERLDATA(1) | Podręcznik programisty Perla | PERLDATA(1) |
NAZWA¶
perldata - typy danych Perla
OPIS¶
Nazwy zmiennych
Perl posiada trzy typy struktur danych: skalary, tablice skalarów oraz asocjacyjne tablice skalarów, zwane też "haszami" ("hashes"). Zwykłe tablice indeksowane są liczbami, począwszy od 0 (indeksy ujemne są liczone od końca tablicy). Tablice asocjacyjne indeksowane są łańcuchami.
Wartości są zwykle przypisane do nazwy (lub nazwanego odwołania). Pierwszy znak nazwy mówi o tym, do jakiego rodzaju struktury danych się ona odnosi. Reszta nazwy określa konkretną wartość, do której odnosi się nazwa. Najczęściej składa się ona z pojedynczego identyfikatora, to znaczy, łańcucha rozpoczynającego się literą lub znakiem podkreślenia i zawierającego litery, podkreślenia i cyfry. W niektórych przypadkach może być ciągiem identyfikatorów, rozdzielonych przez :: (lub przez ', ale nie jest to polecane). Wszystkie oprócz ostatniego interpretowane są jako nazwy pakietów, wskazując przestrzenie nazw, w których będzie wyszukiwany ostatni identyfikator (szczegóły znajdziesz w sekcji Packages podręcznika perlmod(1)). Możliwe jest zastąpienie prostego identyfikatora wyrażeniem, które w czasie wykonania tworzy odwołanie do wartości; jest to opisane szczegółowo poniżej oraz na stronie perlref(1) podręcznika.
Istnieją również zmienne specjalne, których nazwy nie przestrzegają powyższych reguł, po to by nie kolidowały przypadkowo z którąś z twych zwykłych zmiennych. Łańcuchy, które pasują do objętych nawiasami okrągłymi części wyrażenia regularnego zachowywane są pod nazwami zawierającymi tylko cyfry po znaku $ (patrz strony perlop(1) i perlre(1) dokumentacji). Dodatkowo, kilka zmiennych specjalnych, umożliwiających dostęp do wewnętrznych rozwiązań Perla, posiada nazwy zawierające znaki przestankowe (zobacz strony perlvar(1) dokumentacji).
Wartości skalarne zawsze noszą nazwy rozpoczynające się znakiem '$', nawet, gdy odnoszą się do skalara będącego częścią tablicy. Działa to podobnie jak angielski przedimek "the". A zatem mamy:
$dni # zwykła wartość skalarna "dni" $dni[28] # 29-ty element tablicy $dni{'luty'} # wartość dla klucza 'luty' z hasza %dni $#dni # ostatni indeks tablicy @dniale całe tablice lub wycinki tablic oznaczane są przez '@', co działa jak angielskie słowo "these" lub "those":
@dni # ($dni[0], $dni[1],... $dni[n]) @dni[3,4,5] # to samo, co @dni[3..5] @dni{'a','c'} # to samo, co ($dni{'a'},$dni{'c'})zaś całe tablice asocjacyjne (hasze) oznaczane są przez '%':
%dni # (klucz1, wartość1, klucz2, wartość2 ...)Dodatkowo, procedury nazywane są z użyciem początkowego '&', choć jest to opcjonalne, jeśli nie jest dwuznaczne (tak jak w języku angielskim często zbyteczne jest użycie słowa"do"). Elementy tablicy symboli mogą być nazywane z użyciem początkowego '*', ale na razie nie musisz się tym zajmować.
Każdy typ zmiennych ma swoją własną przestrzeń nazw. Możesz, bez obawy o konflikt, używać tej samej nazwy dla zmiennej skalarnej, tablicy czy tablicy asocjacyjnej (lub uchwytu pliku, nazwy procedury czy etykiety). Oznacza to, że $foo i @foo są dwoma różnymi zmiennymi. Znaczy to też, że $foo[1] jest częścią tablicy @foo, nie zaś częścią skalara $foo. Może się to wydawać trochę dziwne, ale tak ma być, gdyż to jest dziwne.
Ponieważ odniesienia do zmiennych i tablic zawsze rozpoczynają się od '$', '@' lub '%', to słowa "zarezerwowane" nie są naprawdę zarezerwowane w odniesieniu do nazw zmiennych. (Jednak SĄ one zarezerwowane w odniesieniu do etykiet i uchwytów plików, które nie posiadają specjalnego początkowego znaku. Nie możesz, na przykład, użyć uchwytu pliku o nazwie "log". Wskazówka: możesz napisać open(LOG,'logfile') zamiast open(log,'logfile'). Użycie nazw uchwytów plików złożonych z dużych liter poprawia również czytelność i chroni przed konfliktami z przyszłymi słowami zastrzeżonymi. Wielkość liter JEST znacząca--"FOO", "Foo" oraz "foo" są zupełnie innymi nazwami. Nazwy rozpoczynające się literą lub znakiem podkreślenia mogą zawierać również cyfry i podkreślenia.
Możliwe jest zastąpienie takiej alfanumerycznej nazwy wyrażeniem, które zwraca odwołanie do obiektu danego typu. Opis tego znajdziesz na stronie perlref(1) podręcznika.
Nazwy rozpoczynające się cyfrą mogą
zawierać tylko cyfry. Nazwy, które nie zaczynają
się od litery, podkreślenia ani cyfry ograniczone są do
pojedynczego znaku, np. $% czy
$$. (Większość z tych
jednoznakowych nazw ma predefiniowane znaczenie dla Perla. Na
przykład, $$ jest identyfikatorem
bieżącego procesu.)
Kontekst
Interpretacja operacji i wartości w Perlu zależy czasami od wymagań kontekstu, w jakim użyta jest operacja czy wartość. Istnieją dwa główne konteksty: skalarny i listowy. Niektóre z operacji zwracają wartości listowe w kontekście oczekującym listy, zaś wartości skalarne w przeciwnym przypadku. (Jeśli tak jest dla danej operacji, to zostanie to wspomniane w jej opisie.) Innymi słowy, Perl przeciąża pewne operacje w oparciu o to, czy spodziewana jest pojedyncza wartość czy mnoga. (W podobny sposób funkcjonują w języku angielskim niektóre słowa, jak "fish" czy "sheep".)
Na zasadzie wzajemności, operacja dostarcza albo kontekstu skalarnego albo listowego każdemu ze swych argumentów. Na przykład, jeśli napiszesz
int( <STDIN> )to operacja całkowita (integer) dostarcza kontekst skalarny dla operatora <STDIN>, który odpowiada czytając jeden wiersz z STDIN i przesyłając go z powrotem do operacji integer. Ta z kolei znajduje wartość typu integer tego wiersza i zwraca ją. Jeżeli, z drugiej strony, napiszesz
sort( <STDIN> )To operacja sortowania dostarcza kontekstu listowego dla <STDIN>, który będzie przetwarzać wszystkie dostępne wiersze aż do końca pliku. Następnie prześle listę tych wierszy z powrotem do procedury sortowania, która z kolei posortuje dostarczone wiersze i zwróci je w postaci listy do kontekstu w jakim wywołano sort.
Przypisanie jest trochę specyficzne, w tym, iż posługuje się swym lewym argumentem do ustalenia kontekstu dla prawego argumentu. Przypisanie do skalara oblicza prawą stronę w kontekście skalarnym, podczas gdy przypisanie do tablicy lub wycinka tablicy rozwija prawą stronę w kontekście listowym. Przypisanie do listy również oblicza prawą stronę w kontekście listowym.
Procedury definiowane przez użytkownika mogą
sprawdzać, czy są wywołane w kontekście
skalarnym czy listowym, ale większość z nich nie dba o
to, gdyż skalary są automatycznie interpolowane w listy.
Zobacz opis funkcji wantarray na stronie
perlfunc(1).
Wartości skalarne
Wszystkie dane w Perlu są skalarami lub tablicami skalarów albo haszami skalarów. Zmienne skalarne mogą zawierać różne rodzaje pojedynczych danych, jak liczby, łańcuchy znakowe czy odwołania. Ogólnie, konwersja z jednej postaci na drugą jest transparentna. (Skalar nie może zawierać wielu wartości, ale może zawierać odwołanie do tablicy czy hasza zawierających wiele wartości.) Z powodu automatycznej konwersji skalarów, operatory i funkcje zwracające skalary nie muszą dbać o to (i faktycznie nie dbają), czy kontekst oczekuje łańcucha czy też liczby.
Skalary nie są koniecznie tą czy inną rzeczą. Nie ma możliwości zadeklarowania zmiennej skalarnej o typie "string", "number", typu "filehandle", czy jakiegoś innego. Perl jest językiem kontekstowo polimorficznym, w którym skalary mogą być łańcuchami, liczbami czy odwołaniami (co obejmuje obiekty). Łańcuchy i liczby uważane są za mniejwięcej to samo w niemal każdym zastosowaniu. Odwołania są jednak nierzutowalnymi wskaźnikami o ściśle określonym typie, z wbudowanym licznikiem odwołań i wywołaniami destruktora.
Wartość skalarna interpretowana jest jako prawda, TRUE, w sensie logiki boolowskiej, jeśli nie jest łańcuchem pustym ani liczbą zero (lub jej łańcuchowym równoważnikiem, "0"). Kontekst boolowski (logiczny) jest po prostu specyficznym rodzajem kontekstu skalarnego.
Faktycznie istnieją dwie odmiany skalarów pustych: zdefiniowane i niezdefiniowane. Niezdefiniowane skalary puste zwracane są gdy brak jest rzeczywistej wartości czegoś, jak w przypadku wystąpienia błędu lub na końcu pliku, albo gdy odwołujesz się do niezdefiniowanej zmiennej czy elementu tablicy. Niezdefiniowany pusty skalar może stać się zdefiniowany po tym, jak po raz pierwszy użyjesz go tak, jakby był zdefiniowany. Ale przed tym możesz posłużyć się operatorem defined(), by stwierdzić, czy wartość jest zdefiniowana czy też nie.
By stwierdzić, czy dany łańcuch jest poprawną liczbą niezerową wystarczy zwykle porównać go zarówno z numerycznym 0 jak i leksykalnym "0" (choć spowoduje to ostrzeżenia opcji -w). Sposób ten wynika stąd, że łańcuchy nie będące liczbami uważane są za 0, tak jak w awk:
if ($str == 0 && $str ne "0") { warn "To nie wygląda na liczbę"; }Zwykle jest to metoda preferowana, gdyż w przeciwnym razie nie traktowałbyś poprawnie notacji IEEE, takich jak NaN czy Infinity. Czasami będziesz wolał posłużyć się funkcją POSIX::strtod czy wyrażeniem regularnym do sprawdzenia, czy dana jest numeryczna. Dokładny opis wyrażeń regularnych znajdziesz w podręczniku perlre.
warn "has nondigits" if /\D/; warn "not a natural number" unless /^\d+$/; # odrzuca -3 warn "not an integer" unless /^-?\d+$/; # odrzuca +3 warn "not an integer" unless /^[+-]?\d+$/; warn "not a decimal number" unless /^-?\d+\.?\d*$/; # odrzuca .2 warn "not a decimal number" unless /^-?(?:\d+(?:\.\d*)?⎪\.\d+)$/; warn "not a C float" unless /^([+-]?)(?=\d⎪\.\d)\d*(\.\d*)?([Ee]([+-]?\d+))?$/;Długość tablicy jest wartością skalarną. Możesz uzyskać długość tablicy @dni obliczając $#dni, tak jak w csh. (Faktycznie, nie jest to długość tablicy, a indeks ostatniego elementu, gdyż (zwykle) istnieje element o indeksie zerowym.) Przypisanie do $#dni zmienia długość tablicy. Skracanie tą metodą tablicy niszczy wartości pozostałe za nowym końcem tablicy. Wydłużenie uprzednio skróconej tablicy JUŻ NIE odtwarza wartości, które były w utraconych elementach. (Było tak w Perlu 4, ale musieliśmy z tym skończyć, by zapewnić wywoływanie destruktorów tam, gdzie jest to oczekiwane.) Możesz też osiągnąć nieco lepszą efektywność wstępnie poszerzając tablicę, która ma się powiększyć. (Można także poszerzać tablicę wykonując przypisanie do elementu, który jest poza jej obecnym końcem.) Tablicę można obciąć do zera przez przypisanie do niej pustej listy (). Poniższe są równoważne:
@cokolwiek = (); $#cokolwiek = -1;Jeżeli przetwarzasz nazwaną tablicę w kontekście skalarnym, to zwraca on długość tablicy. (Zauważ, że nie jest to prawdą dla list, które zwracają ostatnią wartość, tak jak operator przecinka w C. Nie jest to też prawdą dla funkcji wbudowanych, zwracających to, na co mają ochotę.) Poniższe jest zawsze prawdziwe:
scalar(@cokolwiek) == $#cokolwiek - $[ + 1;[Zmienna specjalna $[ określa indeks pierwszego elementu w tablicy i pierwszego znaku w łańcuchu, domyślnie jest to zero.] W wersji 5 Perla zmieniono semantykę $[: pliki nie ustawiające wartości $[ nie muszą już zważać na to, czy inny plik zmienił jej wartość. Inaczej mówiąc, nie zaleca się używania $[. Zatem ogólnie możesz zakładać, że
scalar(@cokolwiek) == $#cokolwiek + 1;Niektórzy programiści wybierają użycie jawnej konwersji, by nie było żadnych wątpliwości:
$liczba_elementow = scalar(@cokolwiek);Jeżeli posługujesz się haszem (tablicą asocjacyjną) w kontekście skalarnym, to zwraca on wartość, która jest prawdą wtedy i tylko wtedy, gdy hasz zawiera jakąkolwiek parę klucz/wartość. (Jeżeli są takie pary, to wartość zwracana jest łańcuchem składającym się z liczby użytych jednostek komórek (buckets) oraz liczby zaalokowanych jednostek komórek, rozdzielonych ukośnikiem. Najbardziej przydaje się to do sprawdzania, czy wkompilowany w Perl algorytm haszowania działa kiepsko na twoim zestawie danych. Na przykład, wrzucasz 10,000 elementów do hasza, ale przetworzenie %HASH w kontekście skalarnym zwraca "1/16", co oznacza, że tylko jedna z szesnastu komórek została użyta, i przypuszczalnie zawiera wszystkie twoje 10,000 pozycji. To się nie powinno zdarzyć.)
Możesz wstępnie przydzielić miejsce na hasz przy pomocy przypisania do funkcji keys(). Zaokrągli to zaalokowane jednostki komórek do najbliższej potęgi dwójki.
keys(%users) = 1000; # zaalokuj 1024 buckets
Konstruktory wartości skalarnych
Literały numeryczne podawane są w zwyczajowych formatach zmiennoprzecinkowych lub całkowitych:
12345 12345.67 .23E-10 0xffff # hex 0377 # ósemkowa 4_294_967_296 # podkreślenie dla lepszej czytelnościLiterały łańcuchowe ograniczone są zwykle przez pojedyncze lub podwójne cudzysłowy. Działają one bardzo podobnie do znaków cytowania powłoki: w literałach łańcuchowych w cudzysłowach zachodzi zastępowanie zmiennych i interpretacja odwrotnego ukośnika. W łańcuchach w apostrofach nie występuje zastępowanie i interpretacja (z wyjątkiem "\'" oraz "\\"). To tworzenia znaków takich jak nowa linia, tabulator itd., stosowane są zarówno zwykłe reguły użycia odwrotnego ukośnika w Unixie, jak i bardziej egzotyczne formy. Listę sposobów cytowania znajdziesz w sekcji Quote and Quotelike Operators podręcznika perlop(1).
Zapisy ósemkowe czy szesnastkowe w literałach łańcuchowych (np. '0xffff') nie są automatycznie zamieniane na ich całkowitą reprezentację. Konwersje te wykonują funkcje hex() i oct(). Więcej szczegółów znajdziesz w opisach tych funkcji w podręczniku perlfunc(1).
Możesz też umieszczać znaki nowej linii bezpośrednio w łańcuchach, tj., mogą one kończyć się w innym wierszu niż się rozpoczęły. Jest to przyjemne, ale jeżeli zapomnisz zamykającego cudzysłowu, to błąd nie będzie zgłaszany dopóty, dopóki Perl nie znajdzie innego wiersza, zawierającego znak cudzysłowu, który może znajdować się o wiele dalej w skrypcie. Zastępowanie zmiennych w łańcuchach ograniczone jest do zmiennych skalarnych, tablic oraz wycinków tablic. (Inaczej mówiąc, nazw rozpoczynających się od $ lub @, po których może opcjonalnie wystąpić, ujęte w nawiasy kwadratowe, wyrażenie traktowane jako indeks elementu tablicy.) Poniższy fragment kodu drukuje "Cena wynosi $100."
$cena = '$100'; # nie interpretowane print "Cena wynosi $cena.\n"; # interpretowaneTak jak w niektórych powłokach, możesz umieścić nazwę w nawiasach klamrowych, by oddzielić ją od następujących dalej znaków alfanumerycznych. Identyfikator w takich nawiasach traktowany jest zawsze jako łańcuch, tak samo jak pojedynczy identyfikator będący indeksem hasza. Nasz wcześniejszy przykład,
$dni{'luty'}może być zapisany jako
$dni{luty}a cudzysłowy będą domniemane automatycznie. Ale cokolwiek bardziej skomplikowanego w indeksie zostanie zinterpretowane jako wyrażenie.
Zauważ, że łańcuch w pojedynczych cudzysłowach musi być oddzielony od poprzedzającego go słowa odstępem, gdyż pojedynczy cudzysłów jest poprawnym (choć nie zalecanym) znakiem w nazwie zmiennej (zobacz Packages w podręczniku perlmod(1)).
Trzema specjalnymi literałami są __FILE__, __LINE__ oraz __PACKAGE__, które reprezentują nazwę bieżącego pliku, numer wiersza oraz nazwę pakietu w danym punkcie twego programu. Mogą być używane wyłącznie jako odrębne tokeny. Nie będą one interpolowane wewnątrz łańcuchów. Jeżeli nie ma bieżącego pakietu (z powodu pustej dyrektywy package;), to __PACKAGE__ jest wartością niezdefiniowaną.
Tokenami __END__ i __DATA__ można posługiwać się do wskazania logicznego końca skryptu przed faktycznym końcem pliku. Dowolny następujący po nich tekst jest ignorowany, ale może być odczytany przy pomocy uchwytu DATA. Wykorzystaj main::DATA dla użytego tokenu __END__, lub też NAZWAPAKIETU::DATA (gdzie NAZWAPAKIETU jest bieżącym pakietem) dla __DATA__. Dwa znaki sterujące: ^D i ^Z są synonimami dla __END__ (lub __DATA__ w module). Szerszy opis __DATA__ i przykład użycia znajdziesz w podręczniku SelfLoader. Zauważ, że nie można czytać z uchwytu pliku DATA w bloku BEGIN. Blok ten jest wykonywany natychmiast po napotkaniu (w czasie kompilacji). W tym momencie nie został jeszcze znaleziony odpowiedni token __DATA__ (lub __END__).
Słowo nie posiadające żadnej innej interpretacji w gramatyce Perla będzie traktowane tak, jakby znajdowało się w cudzysłowie. Są one znane pod nazwą "gołych słów" ("barewords"). Tak samo, jak w przypadku etykiet i uchwytów plików, gołe słowa składające się wyłącznie z małych liter narażają na konlikt z przyszłymi słowami zastrzeżonymi. Jeżeli użyjesz przełącznika -w, to Perl będzie ostrzegał o wystąpieniu takich słów. Niektórzy chcieliby całkowicie wyjąć spod prawa gołe słowa. Jeśli napiszesz
use strict 'subs';to każde gołe słowo, które nie zostanie zinterpretowane jako wywołanie procedury spowoduje błąd kompilacji. Ograniczenie to rozciąga się do końca zawierającego je bloku. Blok wewnętrzny może je jednak zanegować przy pomocy no strict 'subs'.
Zmienne tablicowe w łańcuchach objętych cudzysłowami interpolowane są przez złączenie wszystkich elementów tablicy. Elementy są wówczas rozdzielone ogranicznikiem podanym w zmiennej $" ($LIST_SEPARATOR w module English), domyślnie spacją. Poniższe fragmenty są równoważne:
$temp = join($",@ARGV); system "echo $temp";
system "echo @ARGV";Wewnątrz wzorców wyszukiwania (które również podlegają zastępowaniu w podwójnym cytowaniu) pojawia się brzydka niejednoznaczność: czy /$foo[bar]/ ma być interpretowane jako /${foo}[bar]/ (gdzie [bar] jest klasą znaków wyrażenia regularnego) czy też jako /${foo[bar]}/ (gdzie [bar] jest indeksem tablicy @foo)? Jeżeli nie istnieje @foo, to jest to oczywiście klasa znaków. Jeżeli @foo istnieje, to Perl odgaduje czym ma być [bar], i prawie zawsze ma rację. Jeśli odgaduje źle, albo po prostu jesteś paranoikiem, możesz wymusić poprawną interpretację używając nawiasów klamrowych jak powyżej.
Wierszowa forma cytowania oparta jest na składni "dokumentów-tutaj" używanej ("here-doc") w powłokach. Po sekwencji << podajesz napis ograniczający cytowany materiał, a wszystkie wiersze poniżej bieżącego aż do napisu kończącego są wartością elementu. Napisem kończącym może być identyfikator (słowo) albo jakiś cytowany tekst. Jeżeli jest to tekst cytowany, to rodzaj zastosowanych znaków cytowania określa traktowanie tekstu, tak jak przy zwykłym cytowaniu. Niecytowany identyfikator działa tak, jakby był w podwójnym cudzysłowie. Pomiędzy << a identyfikatorem nie może wystąpić spacja. (Jeżeli wstawisz spację, to będzie ona traktowany jak pusty identyfikator, co jest poprawne i dopasowuje pierwszy pusty wiersz.) Napis kończący musi pojawić się w wierszu kończącym samotnie (niecytowany i bez otaczających białych znaków).
print <<EOF; Cena wynosi $cena. EOF
print <<"EOF"; # to samo, co powyżej Cena wynosi $cena. EOF
print <<`EOC`; # wykonaj polecenia echo hi there echo lo there EOC
print <<"foo", <<"bar"; # możesz składować, jeden za drugim I said foo. foo I said bar. bar
myfunc(<<"TO", 23, <<'TAMTO'); Masz tu linijkę czy dwie. TO a tu jeszcze jedną. TAMTONie zapomnij tylko, że musisz postawić średnik na końcu instrukcji. Perl nie wie przecież, czy nie zamierzasz spróbować zrobić tego:
print <<ABC 179231 ABC + 20;
Konstruktory wartości listowych
Wartości listowe oznaczane są przez oddzielenie pojedynczych wartości przecinkami (i otoczenie listy nawiasami jeśli wymaga tego kolejność):
(LIST)W kontekście nie wymagającym wartości listowej wartość literału listowego jest wartością ostatniego elementu, tak jak w przypadku występującego w C operatora przecinkowego. Na przykład,
@foo = ('cc', '-E', $bar);przypisuje wartość całej listy do tablicy foo, ale
$foo = ('cc', '-E', $bar);przypisuje zmiennej foo wartość zmiennej bar. Zauważ, że rzeczywista tablica w kontekście skalarnym zwraca długość tablicy. Poniższy kod przypisuje $foo wartość 3:
@foo = ('cc', '-E', $bar); $foo = @foo; # $foo dostaje 3Przed nawiasem zamykającym listę literałów możesz użyć opcjonalnego przecinka, zatem możesz pisać:
@foo = ( 1, 2, 3, );LISTY dokonują automatycznej interpolacji podlist. To znaczy, kiedy przetwarzana jest LISTA, to każdy jej element jest przetwarzany w kontekście listowym. Wynikowa wartość listy interpolowana jest do listy LISTA tak, jakby każdy pojedynczy element był członkiem LISTY Zatem w LIŚCIE tracą swoją tożsamość tablice i hasze--lista
(@foo,@bar,&SomeSub,%glarch)zawiera wszystkie elementy @foo, po których następują wszystkie elementy @bar, wszystkie elementy zwrócone przez procedurę o nazwie SomeSub wywołaną w kontekście listowym, i na końcu pary klucz/wartość z %glarch. Jeżeli chcesz odwołać się do listy, NIE wykonując interpolacji zajrzyj do podręcznika perlref(1).
Lista pusta reprezentowana jest przez (). Jej interpolowanie w liście nie daje żadnego efektu. Zatem ((),(),()) jest równoważne (). Podobnie, interpolowanie tablicy bez elementów jest tym samym, co nie interpolowanie w tym miejscu żadnej tablicy.
Wartość listowa może być też indeksowana tak, jak zwykła tablica. Musisz tylko umieścić listę w nawiasach, by uniknąć niejasności. Na przykład:
# Stat zwraca wartość listową $time = (stat($file))[8];
# TUTAJ BŁĄD SKŁADNI $time = stat($file)[8]; # Oj, zapomniałem nawiasów
# znajdź cyfrę szesnastkową $hexdigit = ('a','b','c','d','e','f')[$digit-10];
# "reverse comma operator" return (pop(@foo),pop(@foo))[0];W liście możesz wykonać przypisanie do undef. Przydaje się to do pozbywania się niektórych wartości zwracanych przez funkcję:
($dev, $ino, undef, undef, $uid, $gid) = stat($file);Do list można wykonać przypisanie wtedy i tylko wtedy, gdy dozwolone jest przypisanie do każdego z elementów listy:
($a, $b, $c) = (1, 2, 3);
($map{'czerwony'}, $map{'niebieski'}, $map{'zielony'}) = (0x00f, 0x0f0, 0xf00);Przypisanie tablicy w kontekście skalarnym zwraca liczbę elementów utworzonych przez wyrażenie po prawej stronie przypisania:
$x = (($foo,$bar) = (3,2,1)); # ustaw $x na 3, nie 2 $x = (($foo,$bar) = f()); # ustaw $x na ilość zwróconych przez f()Jest to bardzo wygodne, gdy chcesz wykonać przypisanie listy w kontekście logicznym (boolowskim), gdyż większość funkcji listowych zwraca po zakończeniu przetwarzania listę pustą, co przy przypisaniu daje 0, interpretowane jako fałsz.
Ostatni element może być tablicą lub haszem:
($a, $b, @rest) = split; my($a, $b, %rest) = @_;Faktycznie możesz umieścić tablicę lub hasza w dowolnym miejscu listy, ale pierwsze z nich na liście wessie wszystkie wartości i pozostałe dostaną wartość nul. Może to być pomocne w local() lub my().
Literał hasza (tablicy asocjacyjnej) zawiera pary wartości, które będą interpretowane jako klucz i wartość:
# takie samo przypisanie jak powyżej %map = ('czerwony',0x00f,'niebieski',0x0f0,'zielony',0xf00);Choć listy literałów i nazwane tablice są zwykle wzajemnie wymienne, to nie zachodzi to w przypadku haszy. To, że możesz indeksować wartości listy tak jak zwykłej tablicy nie oznacza, że możesz indeksować listę tak jak hasz. Podobnie, hasze włączone jako części innych list (łącznie z listami parametrów i list zwracanych przez funkcje) zawsze ulegają spłaszczeniu do par klucz/wartość. Dlatego czasem dobrze jest użyć wskazania.
Często bardziej czytelne jest użycie pomiędzy parami klucz/wartość operatora =>. Operator ten jest po prostu bardziej wyróżniającym się wzrokowo synonimem przecinka. Ponadto powoduje, że jego lewostronny operand jest interpretowany jako łańcuch, jeśli jest on gołym słowem, które mogłoby być poprawnym identyfikatorem. Uprzyjemnia to inicjowanie haszy:
%map = ( czerwony => 0x00f, niebieski => 0x0f0, zielony => 0xf00, );lub inicjowanie odwołań do haszy, które będą używane jako rekordy:
$rec = { witch => 'Mable the Merciless', cat => 'Fluffy the Ferocious', date => '10/31/1776', };albo użycie wywoływanych przez nazwę parametrów skomplikowanej funkcji:
$field = $query->radio_group( name => 'group_name', values => ['eenie','meenie','minie'], default => 'meenie', linebreak => 'true', labels => \%labels );Zwróć uwagę na to, iż fakt, że tablica asocjacyjna jest zainicjowana w takim porządku, nie oznacza, że zostanie zwrócona w tym samym porządku. Przykłady, jak ułożyć kolejność zwracanych wyników znajdziesz przy opisie sort w podręczniku perlfunc(1).
Typeglob i uchwyty plików
Perl posługuje się wewnętrznym typem zwanym typeglob. Przechowuje w nim wszystkie zapisy tablicy symboli. Przedrostkiem typu typeglob jest *, gdyż reprezentuje on wszystkie typy. Był on zalecanym sposobem przekazywania tablic i tablic asocjacyjnych przez odwołanie do funkcji, ale obecnie istnieją prawdziwe odwołania, więc jest to rzadko potrzebne.
Podstawowym zastosowaniem typeglob we współczesnym Perlu jest tworzenie synonimów tablicy symboli. To przypisanie:
*cos = *inne;robi $cos synonimem (aliasem) dla $inne, @cos jest aliasem dla @inne, %cos aliasem dla %inne, &cos aliasem dla &inne, itd. Dużo bezpieczniej jest użyć odwołania (wskazania). To:
local *Tutaj::niebieski = \$Tam::zielony;tymczasowo czyni $Tutaj::niebieski aliasem dla $Tam::zielony, ale nie robi @Tutaj::niebieski aliasem dla @Tam::zielony, czy %Tutaj::niebieski aliasem dla %Tam::zielony, itd. W sekcji Symbol Tables podręcznika perlmod(1) znajdziesz więcej takich przykładów. Mimo, że może to wyglądać dziwnie, jest to podstawą całego systemu importu/exportu modułów.
Innym zastosowaniem typeglob jest przesyłanie uchwytów plików do funkcji lub tworzenie nowych uchwytów. Jeżeli potrzebujesz posłużyć się typeglob, by zachować uchwyt pliku, zrób to tak:
$fh = *STDOUT;albo może jako prawdziwe odwołanie, jak to:
$fh = \*STDOUT;W podręczniku perlsub(1) znajdziesz przykłady zastosowania typeglob jako pośrednich uchwytów plików w funkcjach.
Typeglob są również sposobem na tworzenie lokalnych uchwytów plików przy użyciu operatora local(). Istnieją wówczas aż do wyjścia z ich bloku, ale mogą być przesłane powtórnie. Na przykład:
sub newopen { my $path = shift; local *FH; # nie my! open (FH, $path) or return undef; return *FH; } $fh = newopen('/etc/passwd');Obecnie, gdy dysponujemy notacją *foo{COŚ}, typeglob nie są tak często używane do manipulowania uchwytami plików, chociaż wciąż są konieczne do przesłania całkiem nowego uchwytu pliku czy katalogu do funkcji czy z funkcji. Wynika to stąd, że *UCHWYT{IO} działa tylko jeśli UCHWYT był już użyty jako uchwyt. Inaczej mówiąc, do tworzenia nowych wpisów w tablicy symboli może posłużyć *FH, ale nie *foo{COŚ}.
Inną metodą tworzenia anonimowych uchwytów plików jest wykorzystanie modułu IO::Handle. Zaletą tych modułów jest nieukrywanie różnych typów tej samej nazwy podczas local(). Na końcu opisu open() w podręczniku perlfunc(1) zamieszczono odpowiedni przykład.
Dalsze rozważania na temat typeglob i składni *foo{THING} znajdziesz w podręcznikach perlref(1) i perlsub(1), a także w sekcji Symbol Tables podręcznika perlmod(1).
perl 5.005, patch 02 | 3rd Berkeley Distribution |